¿Qué es matriz de confusion?

Una matriz de confusión es una herramienta comúnmente utilizada en el campo de la estadística y el aprendizaje automático para evaluar el rendimiento de un modelo de clasificación o de predicción.

La matriz de confusión se representa mediante una tabla que muestra la cantidad de predicciones hechas por el modelo en cada una de las clases, comparándolas con las clases reales de los datos de prueba.

En una matriz de confusión típica de clasificación binaria, se tienen cuatro términos clave: verdaderos positivos (TP), verdaderos negativos (TN), falsos positivos (FP) y falsos negativos (FN).

  • Verdaderos positivos (TP): se refiere a los casos en los que el modelo predijo correctamente la pertenencia a la clase positiva.
  • Verdaderos negativos (TN): se refiere a los casos en los que el modelo predijo correctamente la pertenencia a la clase negativa.
  • Falsos positivos (FP): se refiere a los casos en los que el modelo predijo incorrectamente la pertenencia a la clase positiva.
  • Falsos negativos (FN): se refiere a los casos en los que el modelo predijo incorrectamente la pertenencia a la clase negativa.

La matriz de confusión se organiza de la siguiente manera:

         |  Predicción Positiva  |  Predicción Negativa

Clase Positiva | TP | FN

Clase Negativa | FP | TN

La información proporcionada por una matriz de confusión es útil para calcular diversas métricas de evaluación del modelo, como la precisión, la sensibilidad, la especificidad y la puntuación F1, entre otras.

En resumen, la matriz de confusión es una herramienta esencial para evaluar el desempeño de un modelo de clasificación o predicción, al proporcionar información sobre los aciertos y errores en las predicciones de cada clase.